Model Selection

Common Voice fine-tuning

# Common Voice fine-tuning

Wav2vec2 Large Xlsr 53 Hungarian

An automatic speech recognition model fine-tuned on the Hungarian Common Voice dataset based on facebook/wav2vec2-large-xlsr-53

Speech Recognition

Transformers Other

Uzbek automatic speech recognition model fine-tuned from OpenAI Whisper Medium

Speech Recognition

Transformers Other

Uzbek speech recognition model fine-tuned on Whisper Base, trained on the Common Voice dataset

Speech Recognition

Transformers Other

Whisper Small Uzbek

Uzbek automatic speech recognition model fine-tuned from OpenAI Whisper-small on Common Voice 17.0 dataset

Speech Recognition

Transformers Other

Whisper Large V3 Turbo Es

Spanish speech recognition model fine-tuned based on Whisper-large-v3-turbo, achieving a word error rate reduction to 5.34% on the Common Voice 17.0 Spanish dataset

Speech Recognition

Transformers Spanish

Whisper Large V3 Az

This model is an automatic speech recognition (ASR) model fine-tuned on the Azerbaijani Common Voice 17.0 dataset based on OpenAI's Whisper Large v3, achieving a word error rate (WER) of 1.195%.

Speech Recognition

Transformers Other

Whisper Large V3 Turkish Test1

A speech recognition model fine-tuned on the Common Voice 17.0 Turkish dataset based on OpenAI Whisper-large-v3

Speech Recognition

Transformers Other

Whisper Tiny Ru

This model is a Russian automatic speech recognition model fine-tuned on the Common Voice 14.0 dataset based on openai/whisper-tiny.

Speech Recognition

A speech recognition model fine-tuned on the Common Voice 11.0 Russian dataset based on OpenAI Whisper-base

Speech Recognition

Transformers Other

Speecht5 Finetuned Commonvoice Ru Translit

A Russian text-to-speech model fine-tuned on the Common Voice 13 dataset based on microsoft/speecht5_tts

Speech Synthesis

Transformers Other

Speecht5 Tts Common Voice 5 Sv

A Swedish text-to-speech model fine-tuned based on Microsoft's SpeechT5 architecture, trained using the Common Voice dataset

Speech Synthesis

Transformers Other

Whisper Medium Turkish 2

Turkish speech recognition model fine-tuned based on OpenAI Whisper Medium, trained on the Common Voice 11.0 dataset

Speech Recognition

Transformers Other

Whisper Large V2 Hungarian

A speech recognition model fine-tuned on the Hungarian Common Voice dataset based on OpenAI Whisper Large-V2

Speech Recognition

Transformers Other

Whisper Large V2 Hausa

This model is a fine-tuned version of OpenAI's Whisper Large-V2 for Hausa speech recognition tasks, trained on the Common Voice 11.0 dataset

Speech Recognition

Transformers Other

Whisper Large V2 Slovenian

This model is a speech recognition model fine-tuned on the Common Voice 11.0 Slovenian dataset based on OpenAI's Whisper Large-V2 model, with a word error rate of 13.83%.

Speech Recognition

Transformers Other

Whisper Large V2 Bn

An automatic speech recognition (ASR) model fine-tuned on Bengali speech datasets based on OpenAI Whisper Large-v2

Speech Recognition

Transformers Other

Whisper Large V2 Ta

Tamil automatic speech recognition (ASR) model fine-tuned based on OpenAI Whisper Large-v2, achieving 8.45% word error rate on Common Voice 11.0 Tamil test set

Speech Recognition

Transformers Other

Whisper Large V2 Malayalam

This is a fine-tuned version of the OpenAI Whisper Large V2 model for Malayalam speech recognition tasks, trained using the Common Voice 11.0 dataset

Speech Recognition

Transformers Other

Whisper Large Pt Cv11

A speech recognition model fine-tuned on the Portuguese Common Voice 11 dataset based on OpenAI's Whisper-large-v2 model

Speech Recognition

Transformers Other

Whisper Large V2 Punjabi

Punjabi automatic speech recognition model fine-tuned on OpenAI Whisper-large-v2, trained on Common Voice 11.0 dataset

Speech Recognition

Transformers Other

Whisper Large V2 Vietnamese

This model is an automatic speech recognition (ASR) model based on OpenAI's Whisper Small architecture, fine-tuned on the Common Voice 11.0 Vietnamese dataset

Speech Recognition

Transformers Other

Whisper Large V2 Cantonese

An automatic speech recognition model fine-tuned on Cantonese dataset based on OpenAI Whisper Large V2, achieving a character error rate of 6.7274% on the test set

Speech Recognition

Transformers Other

Exp W2v2t Fr Vp Fr S438

A French automatic speech recognition model fine-tuned based on the facebook/wav2vec2-large-fr-voxpopuli model, trained using the Common Voice 7.0 French dataset.

Speech Recognition

Transformers French

Exp W2v2t Fr Unispeech S42

A speech recognition model fine-tuned using the Common Voice 7.0 (French) dataset, based on the microsoft/unispeech-large-1500h-cv model

Speech Recognition

Transformers French

Exp W2v2t It Vp Fr S821

An Italian automatic speech recognition model fine-tuned from facebook/wav2vec2-large-fr-voxpopuli, trained using the Common Voice 7.0 Italian dataset

Speech Recognition

Transformers Other

Exp W2v2t It Vp 100k S449

An Italian automatic speech recognition model fine-tuned from the facebook/wav2vec2-large-100k-voxpopuli model, trained using the Common Voice 7.0 Italian dataset.

Speech Recognition

Transformers Other

Exp W2v2t Th Wav2vec2 S664

A Thai speech recognition model fine-tuned based on facebook/wav2vec2-large-lv60, trained using the Common Voice 7.0 dataset

Speech Recognition

Transformers Other

Exp W2v2t En No Pretraining S289

This is a model designed for English speech recognition tasks, based on a randomly initialized wav2vec2 architecture and fine-tuned using the Common Voice 7.0 dataset.

Speech Recognition

Transformers English

Victor Hg Ptbr 2.0

Portuguese speech recognition model fine-tuned on the common_voice dataset based on facebook/wav2vec2-xls-r-300m

Speech Recognition

Wav2vec2 Large Xlsr 53 Cantonese

A Cantonese fine-tuned speech recognition model based on facebook/wav2vec2-large-xlsr-53 using the Common Voice corpus version 8.0

Speech Recognition

Transformers Other

Wav2vec2 Common Voice Tr Demo

This model is a speech recognition model fine-tuned on the Turkish Common Voice dataset based on facebook/wav2vec2-large-xlsr-53

Speech Recognition

Transformers Other

Wav2vec2 Xls R 300m Gn Cv8 4

This is an automatic speech recognition (ASR) model fine-tuned on the Common Voice 8.0 dataset based on the facebook/wav2vec2-xls-r-300m model, specifically optimized for the Guarani language (gn).

Speech Recognition

Transformers Other

This model is an automatic speech recognition model fine-tuned on the Abkhaz language dataset, based on the XLS-R architecture

Speech Recognition

Transformers Other

Wav2vec2 Large Xls R 300m Slovenian

An automatic speech recognition model fine-tuned on Slovenian speech datasets based on facebook/wav2vec2-xls-r-300m

Speech Recognition

Transformers Other

Wav2vec2 Xls R 300m Gn Cv8 3

An automatic speech recognition (ASR) model fine-tuned on the Guarani (gn) Common Voice 8.0 dataset based on the facebook/wav2vec2-xls-r-300m model

Speech Recognition

Transformers Other

Wavlm Large CORAA Pt Cv7

Portuguese automatic speech recognition model based on WavLM-large architecture, fine-tuned on the Common Voice 7.0 dataset

Speech Recognition

Transformers Other

Wav2vec2 Large Xls R 300m Armenian

This is an automatic speech recognition model fine-tuned on the Armenian speech dataset based on facebook/wav2vec2-xls-r-300m

Speech Recognition

Automatic speech recognition model fine-tuned on Tamil dataset based on facebook/wav2vec2-xls-r-300m

Speech Recognition

Transformers Other

Wav2vec2 Large Xlsr Hindi Demo Colab

This model is a fine-tuned version of facebook/wav2vec2-large-xlsr-53 on the Common Voice dataset for Hindi speech recognition tasks.

Speech Recognition

Wav2vec2 Large Xls R 300m Turkish Colab

This model is a speech recognition model fine-tuned on the Common Voice Turkish dataset based on facebook/wav2vec2-xls-r-300m.

Speech Recognition

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase